Google казва, че неговият генератор на изображения с изкуствен интелект понякога би „свръхкомпенсирал“ за расата
Гугъл се извини в петък за неправилното стартиране на нов генератор на изображения с изкуствен интелект, признавайки, че в някои случаи инструментът би „ свръхкомпенсирал “ в търсенето на разнообразна гама от хора, даже когато такава гама не е имала смисъл.
Частичното пояснение за какво изображенията му слагат цветнокожи хора в исторически условия, където нормално не биха били открити, пристигна ден откакто Гугъл сподели той краткотрайно стопира своя чатбот Gemini да генерира изображения с хора в тях. Това беше в отговор на отвращение в обществените медии от някои консуматори, които твърдяха, че инструментът има анти-бели пристрастия в метода, по който генерира расово разнороден набор от изображения в отговор на писмени подкани.
„ Ясно е, че това функционалността пропусна задачата “, се споделя в обява в блог в петък от Прабхакар Рагаван, старши вицепрезидент, който ръководи търсачката на Гугъл и други бизнеси. „ Някои от генерираните изображения са неточни или даже обидни. Благодарни сме за отзивите на потребителите и съжаляваме, че функционалността не работи добре,
Рагаван не загатна съответни образци, само че измежду тези, които привлякоха вниманието в обществените медии тази седмица, бяха изображения, които изобразяват чернокожа жена като баща-основател на Съединени американски щати и демонстрират чернокожи и азиатски хора като немски бойци от нацистката епоха. Асошиейтед прес не съумя да ревизира без значение какви подкани са употребявани за генериране на тези изображения.
Гугъл добави новата функционалност за генериране на изображения към своя чатбот Gemini, прочут преди като Bard, преди към три седмици. Той е построен върху по-ранен проучвателен опит на Гугъл, наименуван Imagen 2.
Гугъл знае от известно време, че сходни принадлежности могат да бъдат неуместни. В механически документ от 2022 година откривателите, създали Imagen, предизвестиха, че генеративните AI принадлежности могат да бъдат употребявани за тормоз или разпространяване на дезинформация „ и повдигат доста опасения по отношение на общественото и културно изключване и пристрастия “. Тези съображения доведоха до решението на Гугъл да не пусне „ обществена проява “ на Imagen или неговия главен код, прибавиха откривателите по това време.
Оттогава натискът за обществено стартиране на генеративни AI артикули набъбна заради конкурентна конкуренция сред софтуерни компании, които се пробват да се възползват от интереса към нововъзникващите технологии, провокиран от появяването на чатбота ChatGPT на OpenAI.
Проблемите с Gemini не са първите, които в последно време засягат генератор на изображения. Microsoft трябваше да поправя личния си инструмент Designer преди няколко седмици, откакто някои го използваха, с цел да основават подправени нецензурен изображения на Тейлър Суифт и други звезди. Проучванията също по този начин демонстрират, че генераторите на изображения с изкуствен интелект могат да разширят расовите и половите стандарти, открити в техните данни за образование, и без филтри е по-вероятно да покажат мъже с по-светла кожа, когато бъдат помолени да генерират човек в разнообразни контексти.
„ Когато изградихме тази функционалност в Gemini, ние я настроихме, с цел да подсигуряваме, че няма да попадне в някои от клопките, които сме виждали в предишното с технологията за генериране на изображения – като основаване на изображения с принуждение или полово очевиден облик или изображения на същински хора “, сподели Рагаван в петък. „ И защото нашите консуматори идват от цялостен свят, ние желаеме да работи добре за всички. “
Той сподели, че доста хора може да „ желаят да получат набор от хора “, когато изискат фотография на футбол играчи или някой, който разхожда куче. Но потребителите, които търсят някой от съответна раса или етническа принадлежност или в съответен културен подтекст, „ би трябвало да получат отговор, който тъкмо отразява това, което питате. “
Въпреки че е свръхкомпенсиран в отговор на някои подкани, в други беше „ по-предпазлив, в сравнение с възнамерявахме, и отхвърли напълно да отговори на някои подкани – неправилно тълкувайки някои доста анодинни подкани като чувствителни “.
Той не изясни какви подкани има поради, само че Gemini рутинно отхвърля поръчки за избрани тематики, като протестни придвижвания, съгласно проби на инструмента от AP в петък, в които той отхвърли да генерира изображения за Арабската пролет, митингите на Джордж Флойд или площад Тянанмън. В един случай чатботът сподели, че не желае да способства за разпространяването на дезинформация или „ тривиализиране на чувствителни тематики “. беше подсилено от притежателя на платформата за обществени медии Илон Мъск, който жигосах Гугъл за това, което той разказа като „ безумно расистко, антицивилизационно програмиране “. Мъск, който има собствен личен AI стартъп, постоянно е подлагал на критика конкурентни разработчици на AI, както и Холивуд за хипотетични демократични пристрастия.
Рагхаван сподели, че Гугъл ще направи „ задълбочени проби “, преди да включи още веднъж способността на чатбота да демонстрира на хората.
Изследователят от Университета на Вашингтон Суроджит Гош, който е изследвал пристрастията в генераторите на изображения с изкуствен интелект, сподели в петък, че беше отчаян, че известието на Raghavan приключи с отвод от отговорност, че изпълнителният шеф на Гугъл „ не може да обещае, че Gemini няма от време на време да генерира неуместни, неточни или обидни резултати. “
За компания, която е усъвършенствала логаритмите за търсене и „ едно от най-големите съкровища на данни в света, генерирането на точни или необидни резултати би трябвало да бъде много ниска граница, за която можем да ги държим виновни “, сподели Гош.